Vers une méthode automatique de construction de hiérarchies contextuelles
نویسندگان
چکیده
Résumé. Dans de nombreux domaines (e.g., fouille de données, entrepôts de données), l’existence de hiérarchies sur certains attributs peut être extrêmement utile dans le processus analytique. Toutefois, cette connaissance n’est pas toujours disponible ou adaptée. Il est alors nécessaire de disposer d’un processus de découverte automatique pour palier ce problème. Dans cet article, nous combinons et adaptons des techniques issues de la théorie de l’information et du clustering pour proposer une technique orientée données de construction automatique de taxonomies. Les deux principaux avantages d’une telle approche sont son caractère totalement non-supervisé et l’absence de paramètre utilisateur à spécifier. Afin de valider notre approche, nous l’avons appliquée sur des données réelles et avons conduit plusieurs types d’expérimentation. D’abord, les hiérarchies obtenues ont été expertisées pour en examiner le pouvoir informatif. Ensuite, nous avons évalué l’apport de ces taxonomies comme support à des tâches de fouille de données nécessitant une définition hiérarchique des valeurs d’attributs : l’extraction de séquences fréquentes multidimensionnelles et multi-niveaux ainsi que la construction de résumés de tables relationnelles. Les résultats obtenus permettent de conclure quant à l’intérêt de notre approche.
منابع مشابه
Fouille de collections de documents en vue d'une caractérisation thématique de connaissances textuelles
Résumé. De nos jours, les entreprises, organismes ou individus se trouvent submergés par la quantité d'information et de documents disponibles. Les utilisateurs ne sont plus capables d’analyser ou d’appréhender ces informations dans leur globalité. Dans ce contexte, il devient indispensable de proposer de nouvelles méthodes pour extraire et caractériser de manière automatique les informations c...
متن کاملMaladies contagieuses non parasitaires-sur une nouvelle méthode de vaccination contre la pasteurellose des bovins et des buffles
متن کامل
Construction automatique d'ontologies à partir d'une base de données relationnelles : application au médicament dans le domaine de la pharmacovigilance
Résumé : Afin de construire une ontologie des médicaments en OWL dans le cadre d’un projet sur la pharmacovigilance, nous envisageons la possibilité de réutiliser les connaissances contenues dans une base de données. L’étude des outils permettant cette transition montre qu’ils ne sont pas entièrement satisfaisants. En effet, ils ne considèrent pas chaque enregistrement comme étant un concept et...
متن کاملAnalyse flexible dans les entrepôts de données : quand les contextes s'en mêlent
Résumé. En autorisant l’observation des données à plusieurs niveaux de précision, les hiérarchies occupent une place importante dans les analyses d’entrepôts de données. Malheureusement, les modèles d’entrepôts existants ne considèrent qu’un sous-ensemble restreint des types possibles de hiérarchie. Par exemple, il n’est pas possible de modéliser le fait que le caractère “faible”, “normal” ou “...
متن کاملUne mesure de similarité contextuelle pour l'aide à la navigation dans un treillis
Extraction et exploitation des annotations contextuelles, Noureddine Mokhtari, Rose Dieng-Kuntz Vers une fouille sémantique des brevets: Application au domaine biomédical, Nizar Ghoula, Khaled Khelif, Rose Dieng-Kuntz Utilisation du Web Sémantique pour la gestion d’une liste de diffusion d’une CoP, Bassem Makni, Khaled Khelif, Hacène Cherfi, Rose Dieng-Kuntz Approche d’annotation automatique de...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2012